I de euklidiske rum Rn er vi vant til at arbejde med indlagte
koordinatsystemer. F.eks. skitserer man ofte planen R2 ved at
tegne et tilhørende koordinatsystem bestående af to vinkelrette linjer
kaldet x-aksen og y-aksen. Faktisk er man så vant til dette billede,
at man let glemmer, at koordinatsystemet ikke er en del af mængden
R2. Koordinatsystemet bruges alene til at navngive punkter i
R2 ud fra dets tilhørende koordinater. For et generelt
F-vektorrum er basisbegrebet den naturlige generalisering af
koordinatsystemer. En basis V=(v1,v2,…,vn) for et F-vektorrum V giver
anledning til en bijektiv afbildning
Idet LV er
bijektiv, så vil punkterne i V svare 1-1 til punkterne i Fn, og
vi kan derfor bruge elementerne i Fn til at navngive elementerne i
V. Idet LV er lineær, så er denne navngivning ydermere så
fin, at addition og skalarmultiplikation i V og Fn er kompatible
(se Proposition 8.4 for den præcise
betydning). I praksis betyder dette, at
så snart man har valgt en basis for V, så kan man
identificere V med Fn.
Betragt det reelle vektorrum P2(R) af
reelle polynomier af grad <2. Polynomierne
p1=1 og p2=X udgør elementerne i en
basis V=(p1,p2) for P2(R). Den
tilsvarende identificering (eller navngivning)
af P2(R) med R2 er givet ved
afbildningen
LV:R2(αβ)→P2(R),↦α+βX.
Vi identificerer altså et
polynomium α+βX med
vektoren (α,β)T∈R2.F.eks. identificeres polynomiet 2+X med
(2,1)T, mens 1+3X identificeres med
(1,3)T. Kompatibiliteten med addition
betyder her, at summen 3+4X af 2+X
og 1+3X identificeres med summen
(3,4)T af (2,1)T og (1,3)T.Havde vi i stedet valgt basen W=(1,1+X), så ville den valgte identifikation
være givet ved
LW:R2(αβ)→P2(R),↦α+β(1+X)=(α+β)+βX.
Med denne identificering opfattes
polynomierne 2+X og 1+3X som hhv.
vektorerne (1,1)T og (−2,3)T.
Ovenstående eksempel illustrerer, at den
betragtede identificering af V med
Fn afhænger af den valgte basis.
Faktisk er dette en vigtig pointe, idet et smart
valg af basis kan simplificere visse problemstillinger voldsomt. Vi
illustrerer denne pointe med et eksempel.
og lad os antage, at vi ønsker at beskrive sammensætningerne Li=L∘L∘…∘L for i≥0.
I princippet kan Li bestemmes ved konkrete
beregninger ud fra beskrivelsen (8.1), men i praksis så er
dette kun muligt for små værdier af i.Lad os angribe opgaven ved at udtrykke
L ved hjælp af en basis
for P3(R). I første omgang betragtes basen
V=(1,X,X2)(8.2)
for P3(R). Dette giver anledning til en isomorfi
LV:R3(α1,α2,α3)T→P3(R),↦α1+α2X+α3X2,
som vi kan bruge til at identificere elementer i R3 og
P3(R). Idet
At beskrive Li, via den valgte
identificering af P3(R) med
R3, svarer altså til at beregne potenser
Ai af A. Desværre er det heller ikke
klart, hvordan Ai er givet for store
værdier af i. Vi påstår, at situationen er
mere overskuelig, hvis vi i stedet for V havde valgt basen
W=(1,(X+1),(X+1)2)(8.4)
for P3(R). For denne basis ville man identificere P3(R) med
R3 via isomorfien
I dette tilfælde er B diagonal, og vilkårlige potenser af B bestemmes derfor let
Bi=⎝⎜⎛1i0002i0005i⎠⎟⎞.(8.6)
Specielt har vi dermed også en fornuftig beskrivelse af potenserne
Li.
Den præcise betydning af den ovenfor diskuterede
navngivning er givet ved følgende begreb.
[Koordinatvektorer]
Lad V=(v1,…,vn) betegne en basis for et
F-vektorrum V. Med
koordinatvektoren for et element v∈V mht. basen V
menes elementet LV−1(v)∈Fn. Koordinatvektoren
betegnes også med [v]V; dvs.
[v]V=LV−1(v).
Betragt basen V=(1,1+X) for det reelle
vektorrum P2(R) bestående af polynomier
af grad <2. Angiv kooordinatvektoren
[p]V for polynomiet p=3+7X mht.
basen V.
Dit svar: Det er en som er med indgange med størrelse x givet ved
Korrekt!Forkert.
Vi bemærker, at koordinatvektoren [v]V for et element v∈V
er karakteriseret som den vektor
⎝⎜⎜⎜⎜⎛α1α2⋮αn⎠⎟⎟⎟⎟⎞∈Fn,(8.7)
der opfylder relationen
v=α1⋅v1+α2⋅v2+…+αn⋅vn.(8.8)
Lad V=(v1,v2,…,vn) betegne en basis for et
F-vektorrum V. Afbildningen
Dette følger af Proposition 6.16, idet LV er en
bijektiv lineær transformation med invers [⋅]V.
Lad E betegne standardbasen for vektorrummet Fn
(jf. Eksempel 7.7(6.)). Så er
[v]E=v(8.9)
for alle v∈Fn.
Såfremt man udover V også arbejder med en
anden basis W=(w1,w2,…,wn)
for V,
så kan man tilsvarende definere koordinatvektoren
[v]W mht. W. Koordinatvektorerne
[v]W og [v]V er
ikke nødvendigvis ens, men vi vil i det
følgende beskrive, hvordan de er forbundet.
I først omgang indfører vi følgende begreb.
[Koordinattransformationsmatrix]
Lad V=(v1,…,vn) og W=(w1,…,wn) betegne
baser for et F-vektorrum V. Koordinattransformationsmatricen
for overgangen fra W-basen til V-basen
defineres som matricen
Betragt de to baser V=(1,X,X2) og W=(1,1+X,2+X2)
for det reelle vektorrum P3(R) bestående af polynomier af grad ≤2.
Angiv koordinattransformationsmatricen for overgangen fra W-basen til V-basen.
Dit svar: Det er en som er med indgange med størrelse x givet ved
Lad v=(1116). Så er (23) koordinatvektoren for v mht.
, mens er koordinatvektoren for v
mht. . Koordinattransformationsmatricen
for overgangen fra V-basen til W-basen er
lig .Korrekt!Forkert.
(0121)
(65)
W
V
At koordinattransformationsmatricen V[□]W er
central i beskrivelsen af sammenhængen mellem
[v]V og [v]W, følger
af nedenstående resultat.
Lad V, U og W betegne baser for et F-vektorrum V. Så
hvor vi undervejs har brugt Proposition 8.4 samt
identiteten (8.11). Dette viser
udsagn (1.).Lad nu A∈Matn(F) betegne en matrix der
opfylder identiteten i udsagn (2.). Bemærk da,
at [wi]W=ei, for i=1,2,…,n, og derfor må
[wi]V=A⋅[wi]W=A⋅ei.
Men A⋅ei er identisk med den i'te
søjle i A jf. (5.23), og dermed
konkluderes det, at de i'te søjler i A og
V[□]W er ens, for i=1,2,…,n.
Specielt er A=V[□]W, hvilket viser
udsagn (2.).Udsagn (3.)
følger nu fra udsagn (2.) (anvendt på
tilfældet V=W) idet
[v]V=I⋅[v]V,(8.13)
for alle v∈V. For at indse udsagn (4.)
bemærker vi, at der, for alle v∈V, gælder
hvor de sidste to lighedstegn følger ved anvendelse af
udsagn (1.). Dermed
følger (4.) fra
udsagn (2.). Endelig
implicerer (3.) og
(4.) (anvendt på tilfældet
U=W), at
for i=1,…,n
jf. Eksempel 8.5.
Specielt er koordinattransformationsmatricen
V[□]E lig den inverse til matricen
(v1∣v2∣…∣vn),
jf. Proposition 8.8(5.).
I Eksempel 8.2 arbejdede vi med to forskellige baser
V=(1,X,X2) og W=(1,X+1,(X+1)2) for det reelle vektorrum
P3(R). Idet
Matricen W[□]V er
sværere at bestemme direkte, men hvis vi udnytter, at
W[□]V er den inverse matrix til
V[□]W, så kan vi bestemme W[□]V
via metoderne beskrevet i forbindelse med
Proposition 4.12. Vi udfører derfor elementære
rækkeoperationer, og opnår
Vi har tidligere set, jf. Lemma 6.23, at enhver lineær afbildning L:Fn→Fm, kan beskrives som multiplikation med en matrix A∈Matm,n(F). Matricen A er ydermere
entydigt bestemt, og kaldes for
standardmatrixrepræsentationen (eller blot SMR) af L. Dette leder frem til følgende
definition.
[Standardmatrixrepræsentation (SMR)]
For en lineær afbildning L:Fn→Fm kaldes matricen
M(L)=(L(e1)∣L(e2)∣⋯∣L(en))∈Matm,n(F)
for
standardmatrixrepræsentationen (SMR) af L.
Følgende observation er da en direkte konsekvens af Lemma 6.23.
Lad L:Fn→Fm betegne en
lineær transformation med SMR lig M(L).
Så vil
L(v)=M(L)⋅v(8.23)
for
v∈Fn.
Betragt nu en generel
lineær afbildning
L:V→W,(8.24)
mellem F-vektorrum V og W af endelige dimensioner >0. Hvis vi indfører baser V=(v1,v2,…,vn) og
W=(w1,w2,…,wm) for hhv. V og W,
så kan vi (via koordinatvektorer) identificere V og W med hhv. Fn og Fm, og på den måde opfatte
L som en afbildning, hvortil der hører en SMR. Det
præcise billede er gengivet i følgende diagram:
Ideen er nu, at SMR af den lineære afbildning LW−1∘L∘LV er relateret til
egenskaber for L. I den forbindelse bemærker
vi, at
og i betragtning af Definition 8.11, så definerer vi derfor følgende:
[Matrixrepræsentation]
Lad L:V→W betegne en lineær afbildning mellem
F-vektorrum V og W med baser hhv. V=(v1,…,vn) og
W=(w1,…,wm). Matrixrepræsentationen for L mht.
baserne V og W defineres da som
matricen
Men jf. (5.23) så kan højresiden af (8.28) også beskrives som
produktet
W[L]V⋅⎝⎜⎜⎜⎜⎛α1α2⋮αn⎠⎟⎟⎟⎟⎞=W[L]V⋅[v]V,
hvor det sidste lighedstegn følger af
(8.27). Hermed er
udsagn (1.)
vist.Antag nu, at en matrix A∈Matm,n(F) opfylder
egenskaben i
udsagn (2.).
Hermed vil der specielt gælde, at
[L(vi)]W=A⋅[vi]V=A⋅ei,(8.29)
for ethvert i=1,2,…,n. Men jf. (5.23), så er højresiden i
(8.29) også lig
den i'te søjle i A. Venstresiden
i (8.29) er derimod
lig den i'te søjle i W[L]V,
og derfor må A=W[L]V som
påstået.
Hvis V betegner et vektorrum med to baser V og W, så er
matrixrepræsentationen for identitetsafbildningen Id:V→V lig
dvs. identisk med koordinattransformationsmatricen
W[□]V.
I Eksempel 8.2 beskrev vi to matrixrepræsentationer
A og B hørende til en lineær operator L:P3(R)→P3(R). Med notation som i Eksempel 8.2 så er
forbindelsen til ovenstående notation givet ved, at
V[L]V=A og
W[L]W=B.
Lad V=(v1,v2) og W=(w1,w2)
betegne baser for hhv. R2 og R2, og lad L:R2→R2 betegne en lineær transformation, der
opfylder, at
L(v1)=w1+2w2 og L(v2)=3w1+4w2.
Specielt er
[L(v1)]W[L(v2)]W=(12)=(34)
og matrixrepræsentationen W[L]V er dermed lig
W[L]V=(1234),
jf. Definition 8.6. Betragt
nu en vektor v∈V på formen
v=α1v1+α2v2, for skalarer
α1,α2∈F.
Så
Vi genfinder dermed formlen
8.15(1.) i
dette konkrete tilfælde.
Lad A∈Matm,n(F) betegne en matrix, og lad LA:Fn→Fm betegne den tilsvarende lineære
afbildning. Idet En og Em betegner standardbaserne for
hhv. Fn og Fm (jf. Eksempel 7.7(6.)), så er den
tilsvarende matrixrepræsentation
Em[LA]En lig A. Dette
følger fra Definition 8.14, idet
[LA(ei)]Em=LA(ei)=A⋅ei=i’te søjle i A.(8.30)
Standardmatrixrepræsentation M(LA)=A for LA er altså lig
matrixrepræsentationen for LA mht. standardbaserne for
hhv. Fn og Fm.
I Eksempel 7.7(5.) definerede vi Pnμ(C) som
underrummet i C∞(R,C), udspændt af de lineært uafhængige
funktioner
hk,μ(t)=tk⋅eμ⋅t(8.31)
for t∈R og
for k=0,1,2,…,n−1. Idet de afledte af hk,μ'erne er
lig (nedenfor skal h−1,μ tolkes som nulfunktionen):
Vi vil nu undersøge, hvordan matrixrepræsentationer
opfører sig ifm. forskellige typer af kompositioner.
Vi starter med at beskrive matrixrepræsentationer for sammensætninger af lineære afbildninger.
Lad T:U→V og L:V→W betegne lineære
afbildninger mellem F-vektorrum. Lad samtidig U, V og W
betegne baser for hhv. U, V og W. Så
Udsagnet følger ved anvendelse af
karakteriseringen af matrixrepræsentationer
beskrevet i Proposition 8.15(2.).
Vi sætter A=W[L]V⋅V[T]U,
og bemærker, at
for alle u∈U. Specielt opfylder A
betingelserne i Proposition 8.15(2.)
mht. den lineære transformation L∘T
og baserne W og U. Hermed
følger (8.34) af
Proposition 8.15(2.).
Lad L:V→W betegne en lineær afbildning mellem
F-vektorrum. Lad V og V′ betegne baser for V, og lad
W og W′ betegne baser for W. Så er
W′[L]V′=W′[□]W⋅W[L]V⋅V[□]V′.(8.35)
Lad L:R2→R2 betegne en lineær operator på
det reelle vektorrum R2. Lad V og W betegne to baser for
R2, og antag, at
V[L]V=(12−14) og at V[□]W=(1−1−12).
Angiv W[L]W.
Dit svar: Det er en som er med indgange med størrelse x givet ved
I Eksempel 8.16(2.) fandt vi matrixrepræsentationer
V[L]V=A og W[L]W=B for en
konkret lineær operator L:P3(R)→P3(R) hørende
til to forskellige baser V og W. Herudover så har vi i
Eksempel 8.10(2.) beskrevet koordinattransformationsmatricerne
V[□]W og W[□]V. Vi kan derfor direkte tjekke,
at identiteten
I Eksempel 8.16(5.)
studerede vi differentiationsoperatoren D på vektorrummene
Pnμ(C), og beskrev de tilhørende matrixrepræsentationer
Vnμ[D]Vnμ. Sammensætningen Dk af den lineære
operator D med sig selv k gange er ligeledes en lineær operator
på Pnμ(C). Den tilsvarende matrixrepræsentation
mht. Vnμ er, ifølge Proposition 8.17, lig
Vnμ[Dk]Vnμ=(Vnμ[D]Vnμ)k.(8.37)
Hvis f.eks. n=2 og μ=1, så er
V21[D2]V21=(1011)2=(1021).(8.38)
8.3 Beregninger af matrixrepræsentationer
Matrixrepræsentationer
for lineære transformationer mellem vektorrum af formen Fn kan
beregnes ved hjælp af elementære
rækkeoperationer. Dette er beskrevet i følgende resultat.
Lad L:Fn→Fm betegne en lineær transformation, og
lad V=(v1,…,vn) og W=(w1,…,wm) betegne
baser for hhv. Fn og Fm. Den opdelte matrix
At W er invertibel følger, idet W er en basis
(jf. Proposition 7.4). Faktisk er W lig
koordinattransformationsmatricen
E[□]W, jf.
Eksempel 8.10(1.), og dermed er W−1 lig
W[□]E, jf.
Proposition 8.8(5.). Relationen (8.41)
er dermed ækvivalent med, at
W[□]E⋅L(vi)=[L(vi)]W(8.42)
for i=1,2,…,n,
ifølge Definition 8.14. Det sidste udsagn følger fra
Proposition 8.8(1.), idet L(vi)=[L(vi)]E
(jf. Eksempel 8.5).
Betragt den lineære afbildning LA:R3→R2
defineret ved matricen
A=(56−4−534).(8.43)
Vælg baser V=(v1,v2,v3) for R3 og
W=(w1,w2) for R2 bestående af vektorerne
og udfører elementære rækkeoperationer, indtil vi opnår
(1001100−111).(8.46)
Vi konkluderer dermed, at
W[LA]V=(100−111).(8.47)
Vi kan også anvende Proposition 8.21 til at beregne
koordinattransformationsmatricen W[□]V mht. baser
V=(v1,…,vn) og W=(w1,…,wn) for Fn.
Vi erindrer, at W[□]V er identisk med
matrixrepræsentationen W[Id]V ifølge
Eksempel 8.16(1.). Dermed er W[□]V
bestemt som matricen opfyldende, at
(In∣W[□]V)
er rækkeækvivalent med
8.4 Beregninger af kerner og billeder via
matrixrepræsentationer
Vi har tidligere set, hvordan man konkret kan bestemme kerner og
billeder for lineære afbildninger mellem F-vektorrum af typen
Fn (svarende til nulrum og søjlerum for de tilsvarende
SMR). Matrixrepræsentationer giver os nu mulighed for at overføre
disse resultater til mere generelle vektorrum. I den forbindelse er
følgende resultat anvendeligt.
Lad L:V→W betegne en lineær afbildning, og lad V
og W betegne baser for hhv. V og W. Så gælder:
Et element v∈V tilhører kernen ker(L) for L hvis og kun hvis den
tilsvarende koordinatvektor [v]V er et element i nulrummet
N(W[L]V) for matrixrepræsentationen
W[L]V.
Et element w∈W tilhører billedet af L hvis og kun hvis den tilsvarende
koordinatvektor [w]W er et element i søjlerummet
R(W[L]V) til matrixrepræsentationen
W[L]V.
Idet LW er en isomorfi, så er v∈V et element i ker(L)
hvis og kun hvis
LW−1(L(v))=0.(8.49)
Men venstresiden af (8.49) er lig [L(v)]W,
som ifølge Proposition 8.15(1.) også kan beskrives som
[L(v)]W=W[L]V⋅[v]V.(8.50)
Dermed følger
påstand (1.)
umiddelbart.Lad nu w betegne et
element i W. Hvis w er et element i billedet L(V), så
eksisterer der et v∈V, så w=L(v). Som ovenfor har vi
derfor
[w]W=[L(v)]W=W[L]V⋅[v]V,(8.51)
og [w]W er derfor et element i søjlerummet til
W[L]V. Hvis omvendt [w]W er et
element i søjlerummet til W[L]V, så findes der en
vektor a∈Fn (hvor n betegner dimensionen af V), så
[w]W=W[L]V⋅a.(8.52)
Sæt nu v=LV(a), og observer, at
[L(v)]W=W[L]V⋅[v]V=W[L]V⋅a=[w]W.
Idet LW er en isomorfi, så følger det dermed, at w=L(v), og
w er derfor et element i billedet af L som ønsket.
Lad L:V→W betegne en lineær afbildning og lad V
og W betegne baser for hhv. V og W. Lad r betegne rangen af
matrixrepræsentationen W[L]V. Så gælder:
Afbildningen
kerLv→N(W[L]V),↦[v]V,(8.53)
er veldefineret og en lineær isomorfi.
Specielt er: dim(ker(L))=dim(V)−r.
Afbildningen
L(V)v→R(W[L]V),↦[v]W,(8.54)
er veldefineret og en lineær isomorfi.
Specielt er: dim(L(V))=r.
At de angivne afbildninger er veldefinerede er en
konsekvens af Lemma 8.23.
Begge afbildninger er tilmed injektive lineære
transformationer, idet koordinatiseringsafbildningerne [⋅]V og [⋅]W begge opfylder
dette.For at vise surjektiviteten af (8.53)
så lader vi a betegne et element i nulrummet
for W[L]V, og lader herefter
v∈V betegne LV(a). Så vil
[v]V=a, og v er derfor et element
i ker(L) ifølge Lemma 8.23.
Specielt viser identiteten [v]V=a også,
at a er i billedet for (8.53). Vi
konkluderer dermed, at (8.53) er
surjektiv. At (8.54) er surjektiv vises på
tilsvarende vis. Vi konkluderer, at (8.53)
og (8.54) er isomorfier.Dimensionsudsagnene er nu er
konsekvens af
Proposition 6.20 og Korollar 7.36.
Lad L:V→W betegne en lineær afbildning og lad V
og W betegne baser for hhv. V og W. Så er L en lineær
isomorfi hvis og kun hvis W[L]V er en invertibel (kvadratisk)
matrix. I givet fald er
V[L−1]W=(W[L]V)−1.
Lad L:P2(R)→P2(R) betegne en
lineær operator på det reelle vektorrum P2(R). Lad
V betegne en basis for P2(R) og antag, at
V[L]V=(1134).
Angiv V[L−1]V
Dit svar: Det er en som er med indgange med størrelse x givet ved
Antag, i første omgang, at L er en lineær isomorfi. Så er
dim(V)=dim(W) ifølge Proposition 6.20. Specielt er
W[L]V en kvadratisk matrix. Idet L
er injektiv må ker(L) og dermed også nulrummet
N(W[L]V) (jf. Proposition 8.24(1.)) være trivielt. Som konsekvens er
W[L]V invertibel, jf.
Proposition 4.6.Antag omvendt, at W[L]V er kvadratisk og
invertibel. Sæt n=dim(V). Så er nulrummet
N(W[L]V) af dimension 0,
og ker(L) er dermed lig {0},
jf. Proposition 8.24(1.).
Vi konkluderer, at L er injektiv,
jf. Sætning 6.11.
Ifølge
Sætning 7.20 så er L(V)⊆W ydermere af dimension
n=dim(W), og dermed må L(V)=W, jf.
Proposition 7.16. Vi konkluderer, at L
både er injektiv og surjektiv og dermed en lineær isomorfi.Dette viser den første del af det påståede udsagn. Antag nu, at L
er en lineær isomorfi mellem vektorrum af
samme dimension n, og lad L−1 betegne den inverse lineære
transformation. Ifølge
Proposition 8.17 opnås nu
W[L]V⋅V[L−1]W=W[L∘L−1]W=W[IdW]W=I,
hvor I betegner identitetsmatricen af størrelse n. Specielt
er den inverse til W[L]V lig V[L−1]W.
Betragt det reelle vektorrum
P3(R) med basis V=(1,X,X2), og lad os beskrive kernen og
billedet for den lineære operator
Ved anvendelse af metoderne beskrevet i Afsnit 7.3 så
bestemmes en basis for nulrummet til V[D]V til ((1,0,0)T), mens søjlerummet har basis ((1,0,0)T,(0,2,0)T). Idet
LV((1,0,0)T)=1 og LV((0,2,0)T)=2X,(8.56)
så følger det, jf. Proposition 8.24, at
(1) er en
basis for ker(D), mens (1,2X) er en basis for billedet af D.
Specielt er ker(D) lig mængden af konstante polynomier, mens
billedet er lig underrummet P2(R) i P3(R).
I Eksempel 8.16(5.)
fandt vi matrixrepræsentationen
for den lineære operator D:Pnμ(C)→Pnμ(C) mht. basen Vnμ. Hvis μ=0, så er
Vnμ[D]Vnμ invertibel, og D:Pnμ(C)→Pnμ(C) er dermed en invertibel
afbildning (jf. Korollar 8.25).Tilfældet μ=0 er en generalisering af situationen i
Eksempel 8.26(1.), og det overlades
til læseren at beskrive, hvad der sker i dette
tilfælde.